探究 GCC、LLVM 和 Clang 的渊源

#Technomous

传统的编译器通常分为三个部分，前端（frontEnd），优化器（Optimizer）和后端（backEnd）。在编译过程中，前端主要负责词法和语法分析，将源代码转化为抽象语法树；优化器则是在前端的基础上，对得到的中间代码进行优化，使代码更加高效；后端则是将已经优化的中间代码转换为针对各自平台的机器代码。

GCC（GNU Compiler Collection，GNU 编译器套装），是一套由 GNU 开发的编程语言编译器。GCC 原名为 GNU C 语言编译器，因为它原本只能处理 C 语言。GCC 快速演进，变得可处理 C++、Fortran、Pascal、Objective-C、Java 以及 Ada 等其他语言。

早期苹果打算直接使用 GCC 进行修改来满足自己的需求，但是后期发现整个工程越来越难以管理和社区的目标越走越远。而且 GCC 的代码耦合度太高，很难独立，而且越是后期的版本，代码质量越差。所以苹果打算从头写自己的编译器。前期先将 GCC 作为前端，重新写了个后端 LLVM（Low Level Virtual Machine，底层虚拟机）来提供程序语言的编译器优化、链接优化、在线编译优化、代码生成，即 GCC/LLVM 组合。后期苹果又从零开始写 C、C++、Objective-C 语言的前端 Clang，至此便用 Clang/LLVM 组合完全替代掉了 GCC。所以苹果在编译器的演变上其实经历了三个阶段：GCC -> GCC/LLVM -> Clang/LLVM。